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摘要 : [ 目的 /意义 ] 情 报 学 作为 计算 性 较 强 的 人 文 社 科学 科 , 具 备 数据 科学 的 特点 ,大 数据 相关 技术 能 为 
情报 学 提供 有 效 手 段 , 因 此 ,设立 情报 学 取向 的 “数据 科学 与 大 数据 技术 ”专业 ,培养 具有 大 数据 思维 和 扎实 的 
情报 学 专业 基础 、 掌 握 大 数据 处 理 技术 及 分 析 理 论 、 并 能 将 其 应 用 于 情报 学 理论 与 实践 的 复合 型 人 才 ,能 够 促 
进 情报 学 学 科 发 展 。[ 方法“ 过程] 对 国内 外 大 数据 相关 专业 的 培养 目标 和 课程 设置 模式 进行 调研 ,总 结 学 科教 
育 发 展 特色 ,结合 国内 的 教学 资源 情况 ,设计 情报 学 取向 的 大 数据 专业 人 才 培 养 计 划 。[ 结果 /结论 ] 情报 学 与 
大 数据 既 有 联系 又 有 不 同 , 情 报 学 为 大 数据 提供 了 基础 研究 方法 ,促进 了 多 源 数 据 融 合 , 拓 帘 了 大 数据 的 应 用 
领域 ;大 数据 为 情报 学 研究 提供 了 更 多 的 可 能 性 .丰富 了 研究 方法 ,提升 了 研究 效率 、 扩 大 了 研究 范围 。 情 报 学 
取向 的 大 数据 与 数据 科学 专业 人 才 的 培养 , 既 有 其 必要 性 ,又 有 其 不 可 替代 性 。 学 科 体 系 需 进一步 改革 创新 ， 
误 了 六 更 多 紧密 结合 大 数据 与 情报 学 专业 的 新 兴 课 程 ,如 文献 大 数据 分 析 、 用 户 大 数据 研究 等 ,系统 地 培养 学 生 


报 学 领域 知识 与 计算 机 技术 和 大 数据 技术 融合 创新 的 能 力 。 
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大 数据 数据 科学 


随 着 大 数据 时 代 的 到 来 ,社会 各 个 行业 的 数据 呈 
现 厂 高 速 增长 的 状态 ,数据 资源 已 经 成 为 了 重要 的 现 
代 徐 略 资源 。 数 据 科学 学 科 的 建设 及 大 数据 人 才 的 培 
养 因 此 受到 了 学 术 界 与 教育 界 的 广泛 关注 。 自 北 卡 罗 
莱 纲 州立 大 学 2007 年 首次 设立 “数据 分 析 " 硕 士 专业 
以 采 ,美国 已 经 有 多 所 高 校 陆续 开设 “数据 分 析 "或 
“数据 科学 "等 相关 专业 ,不 仅 涉及 到 传统 的 计算 机 、 
数学 和 统计 学 等 院 系 ,而 且 还 涉及 到 图 书 情报 等 人 文 
社 科 类 的 院 系 ,例如 ,阿姆斯特丹 大 学 的 人 文 、 档 案 和 
信息 研究 院 设立 了 “信息 研究 :数据 科学 "专业 。 与 国 
外 相 比 ,我 国 高 校 在 大 数据 与 数据 科学 教育 开展 相对 
较 晚 ,最 早 是 北京 航空 航天 大 学 于 2013 年 开设 了 “ 数 
据 科学 "硕士 专业 ,可 以 说 开 我 国正 式 的 大 数据 高 等 教 
育 的 先河 。2016 年 ,教育 部 批准 首次 北京 大 学 、 对 外 
经 济 贸易 大 学 .中 南大 学 三 所 高 校 增设 “数据 科学 与 大 
数据 技术 "本科 专业 。 截 至 2018 年 底 , 国 内 一 共有 283 


所 高 校 获 批 设立 该 本 科 专业 。 在 这 些 高 校 中 ,承担 该 
专业 建设 的 院 系 各 有 不 同 , 不 同 的 学 科 院 系 和 课程 内 
容 反 映 了 一 个 学 校 及 学 院 的 办 学 特色 和 人 才 特 色 ,以 
及 考虑 培养 出 来 的 学 生 是 否 受 到 了 社会 的 欢迎 。 近 年 
来 ,情报 学 领域 对 大 数据 的 研究 越 来 越 重视 ,对 具有 图 
书 情 报 特色 的 大 数据 人 才 培 养 得 到 了 本 学 科 关注 ,学 
界 多 有 探讨 。 苏 新 宁 指 出 ,大 数据 为 情报 学 的 发 展 带 
来 了 机 缘 ,情报 学 教学 体系 的 变革 要 扬长 避 短 ,专注 情 
报 技术 的 研究 ”。 巴 志 超 等 人 认为 ,情报 学 要 深入 推 
进 各 门类 学 科 与 情报 学 之 间 多 方式 ,大 跨度 的 广泛 交 
又 ,从 而 建设 多 元 开放 、 互 动 协同 发 展 的 学 科 生态 
群 汪 。 苏 日 娜 等 人 以 15 所 iSchools 高 校 为 调研 对 象 ， 
讨论 了 图 书馆 与 情报 学 学 科 下 的 数据 科学 定位 、 数 据 
科学 与 传统 图 书 情报 课程 结合 和 人 才 培 养 等 问题 ” 。 

在 此 背景 下 ,本 文 探讨 了 数据 科学 与 大 数据 专业 
本 科教 育 的 相关 问题 。 首 先 对 国内 外 大 数据 专业 的 培 
养 目 标 .教学 内 容 和 课程 计划 进行 了 广泛 调研 ,在 此 基 
础 上 总 结 了 大 数据 专业 教学 内 容 的 特点 ;随后 结合 国 
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内 的 实际 情况 ,总结 了 建设 基于 情报 学 的 数据 科学 与 
大 数据 技术 专业 的 必要 性 ;最 后 ,初步 设计 了 情报 学 取 
向 的 大 数据 专业 人 才 培 养 课程 设置 和 培养 目标 。 


2 国内 外 大 数据 教育 的 调研 


早 在 20 世纪末, 国外 就 有 高 校 尝试 开设 数据 科学 
相关 的 专业 及 课程 。 发 展 至 今 ,国外 大 数据 教育 的 学 
科 领 域 呈现 出 多 样 化 的 特点 ,计算 机 科学 .数学 与 统 
计 .经济 与 管理 .生物 与 医疗 .科学 与 技术 新闻 与 传媒 
等 多 个 学 科 领 域 均 有 开设 大 数据 专业 ,课程 设置 及 研 
究 方向 各 具 特 色 , 阮 敬 等 “总 结 出 国外 大 数据 相关 硕 
士 人 才 培 养 主要 有 七 个 方向 ,包括 :信息 系统 ,数据 科 
学 .健康 医疗 、 商 业 分 析 、 应 用 统计 、 商 务 智能 和 MBA 
大 数据 方向 。 在 美国 ,由 60 多 所 学 校 的 信息 学 院 组 成 
的 jchool 联盟 院 校 中 ,已 经 有 多 所 图 书 情报 院 系 开设 
也 狂 据 科学 与 大 数据 技术 的 专业 5 。 

与 国外 大 数据 相关 的 专业 大 多 面向 硕士 研究 生 不 
司 S 我 国 高 教 界 更 关注 本 科教 育 。2016 年 ,教育 部 颁 
布 的 《2015 年 度 普通 高 等 学 校本 科 专业 备案 和 审批 结 
四 中 ,首次 增设 了 “数据 科学 与 大 数据 技术 ”本 科 
,并 批准 了 北京 大 学 .对 外 经 济 贸易 大 学 ,中 南大 
党 纪 所 高 校 设立 该 专业 ,此 后 分 别 于 2017 年 度 ” 和 
2 全 吕 年 度 中 分 别 新 增 了 32 所 高 校 与 248 所 高 校 设立 
这 全 专业 , 见 图 1。 截至 2018 年 ,国内 一 共有 283 所 高 
檬 锋 批 “数据 科学 与 大 数据 技术 "专业 ,其 中 ,985 及 
21] 祝 校 共 36 所 , 占 比 13% 。 该 专业 学 制 为 四 年 , 授 
予 下 学 学 位 或 理学 学 位 ,其 中 ,北京 大 学 、 人 民 大 学 和 
记 洒 财经 大 学 等 高 校 在 多 个 院 系 开设 了 这 一 专业 。 但 
目前 国内 尚未 有 图 书 情报 或 其 他 人 文 社 科 院 系 开设 该 
专业 。 
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2016 年 (第 一 批 ) ”2017 年 (第 二 批 ) 2018 年 (第 三 批 ) 


图 1 全 国 开设 “数据 科学 与 大 数据 技术 ” 
专业 本 科 的 高 校 数 量 


本 文 对 国内 外 大 数据 相关 专业 的 培养 目标 教学 内 
容 和 课程 计划 进行 了 调研 ,发现 大 数据 专业 教育 有 以 下 
两 个 显著 特点 ,一 是 已 经 形成 了 层次 性 的 课程 体系 ,二 
是 形成 了 与 所 依托 专业 相 结合 的 特色 化 侧重 方向 。 


2.1 层次 性 的 课程 体系 

数据 科学 是 一 门 以 大 数据 为 研究 对 象 的 交叉 性 学 
科 , 其 理论 基础 主要 来 自 于 计算 机 科学 、 应 用 数学 以 及 
言 息 管理 与 信息 系统 等 相关 学 科 , 同 时 ,由 于 大 数据 本 
身 只 存在 于 各 个 不 同 领 域 和 不 同 的 行业 之 中 ,不 是 独 
立 于 任何 行业 或 学 科 领 域 的 简单 数据 堆积 ,因此 ,人 处理 
大 数据 还 需要 具备 大 数据 所 属 领 域 或 行业 的 专门 知 
识 , 例 如 经 济 学 法 学 .生物 学 .医学 等 学 科 知 识 。 在 实 
践 上 ,国内 外 大 数据 专业 已 经 在 课程 体系 上 形成 了 比 
较 清 晰 的 三 个 层次 , 见 表 1。 其 中 ,最 顶层 是 应 用 层 ， 
是 利用 大 数据 及 数据 科学 的 理念 和 方法 去 解决 问题 的 
应 用 场景 ,实际 上 就 是 诸如 生物 医学 .企业 管理 .科技 
管理 .电子 商务 等 各 类 产生 大 数据 的 行业 所 属 的 学 科 
领域 ,前 常见 的 包括 这 些 学 科 专 业 的 核心 和 关键 知识 ， 
具体 体现 是 这 些 学 科 的 核心 课程 ;中 间 层 是 方法 层 , 由 
大 数据 及 数据 科学 的 理念 方法 和 技术 构成 ,一 方面 ， 
这 一 层次 的 课程 为 学 生 提供 处 理 大 数据 的 基本 理念 、 
方法 .技术 与 工具 。 另 一 方面 ,与 应 用 层 的 知识 相 结 
合 ,提供 有 关 特 定 领 域 大 数据 处 理 的 模型 和 算法 ,训练 
学 生 对 应 用 数据 进行 理解 .抽象 和 建 模 ,从 而 在 底层 的 
计算 平台 上 了 予以 处 理 和 分 析 ; 最 底层 是 基础 层 , 主 要 包 
括 统计 学 数学、 计算 理论 与 技术 等 基础 学 科 课 程 ,这 
是 目前 公认 的 大 数据 与 数据 科学 的 基础 领域 学 科 。 

表 1 层次 性 的 课程 体系 


课程 所 属 体系 层次 层次 介绍 
基础 层 数学 .统计 学 .计算 机 理论 与 技术 等 基础 课程 
方法 层 涉及 大 数据 方法 与 技术 的 方法 课程 
应 用 层 面向 应 用 领域 的 相关 课程 


例如 ,对 外 经 济 贸易 大 学 信息 学 院 的 “数据 科学 与 
大 数据 "专业 的 课程 设置 ”比较 明显 地 体现 出 了 层次 
性 的 特征 ,其 课程 体系 划分 为 数学 基础 .计算 机 基础 、 
大 数据 的 技术 与 方法 ` 经 管 法 四 大 课程 模块 ,分 别 对 应 
着 基础 层 、 方 法 层 ,应 用 层 三 大 层次 ,具体 课程 体系 见 
表 2。 数 学 与 计算 机 基础 课程 模块 主要 培养 学 生 传 统 
言 县 技术 行业 的 基本 能 力 ,也 为 数据 科学 及 大 数据 方 
法 与 技术 相关 的 方法 课程 提供 基础 知识 ;大 数据 技术 
与 方法 相关 课程 旨 在 让 学 生 掌握 数据 分 析 与 数据 建 模 
方法 大 数据 处 理 技术 ,从 而 具备 理解 抽象、 分析 、 建 
模 、 开 发 等 一 系列 解决 数据 科学 问题 的 能 力 ; 经 管 法 相 
关 课 程 模块 主要 涉及 经 济 学 管理 学 .法 学 相关 的 课 
程 ,能 够 让 学 生 对 特定 数据 行业 的 知识 有 所 了 解 ,支持 
学 生 从 事 经 济 金融 ,管理 ,物流 ,商务 等 领域 的 数据 分 
析 工 作 的 素养 与 知识 储备 。 


ChinaXiv 合 作 期 刊 


陈 沫 ,， 李 广 建 ， 陈 陪 聪 . 情报 学 取向 的 “数据 科学 与 大 数据 技术 ”专业 人 才 培 养 [J. 图 书 情 报 工作 ,2019 ,63(12) :5 - 11. 


表 2 对 外 经 济 贸易 大 学 信息 学 院 “ 数 据 科学 
与 大 数据 ”专业 课程 体系 


课程 所 属 ，，，。 
体系 层次 ， 课 程 分 类 课程 名 称 
基础 层 ”数学 基础 数学 分 析 线性 代数 概率 论 与 数理 统计 、 随 机 过 程 


计算 机 基础 ”C+ + 程序 设计 、 计 算 机 组 成 原理 数据 结构 、 操 作 
系统 原理 JAVA 程序 设计 数据库 系统 原理 ,计算 
机 网 络 、Android 程序 开发 基础 Web 应 用 程序 设计 


多 元 统计 分 析 ,回归 分 析 与 计量 .时间 序 列 分 析 ` 器 
学 习 与 数据 挖掘、 数据 可 视 化 原理 及 应 用 、 大 数据 
存储 与 管理 ,Spark 大 数据 处 理 ,Storm 实时 大 数据 
处 理 、 大 数据 分 析 实 践 


微观 经 济 学 .货币 银行 学 ,管理 学 原理 .金融 风险 管 
理 .电子 商务 .推荐 系统 原理 .电子 金融 .网 络 营 销 、 
文本 挖掘 与 自然 语言 理解 
2.2 ”特色 化 的 侧重 方向 
一 大 数据 专业 教育 的 第 二 个 特点 是 已 经 形成 了 各 具 
管 信 化 的 侧重 方向 。 目 前 ,各 个 国内 外 高 校 的 大 数据 
全 申 都 是 在 已 有 专业 的 基础 上 展开 的 ,通常 都 是 与 原 
本 
共和 一 定 的 侧重 点 ,其 培养 模式 基本 上 可 以 归纳 为 以 
2CD1 以 技术 为 特色 的 大 数据 教育 ”以 技术 为 特色 
h 数据 教育 是 目前 国内 外 大 数据 及 数据 科学 相关 专 
YIEB 流 的 侧重 方向 , 主要 是 培养 偏向 于 大 数据 技术 研 
客 尖 应 用 的 人 才 ,培养 学 生 设计 新 的 大 数据 相关 系统 、 
技术 或 程序 的 计算 机 开发 能 力 , 更 加 强调 学 生 掌 握 大 
詹 钼 技术 前 沿 的 状态 及 趋势 ,具备 大 数据 平台 与 工具 
的 蹇 发 数据 处 理 系统 的 构建 等 实践 能 力 。 这 类 专业 
的 课程 体系 与 计算 机 技术 与 理论 结合 得 更 加 紧密 , 通 
二 
versity of Warwick ) 计算 机 科学 学 院 的 数据 分 析 ( data 
analytics) 专业 .电子 科技 大 学 计算 机 科学 与 工程 学 院 
下 的 数据 科学 与 大 数据 技术 专业 北京 邮电 大 学 计算 
机 学 院 下 的 数据 科学 与 大 数据 技术 专业 等 , 表 3 是 以 
北京 邮电 大 学 为 例 列 出 的 以 技术 为 特色 的 课程 设置 。 
北京 邮电 大 学 的 数据 科学 与 大 数据 技术 专业 的 课 
程 体系 中 包含 了 大 量 的 计算 机 科学 与 技术 学 科 的 基础 
课程 ,以 培养 学 生 多 元 化 的 大 数据 应 用 编程 能 
2.2.2 ”以 计算 为 特色 的 大 数据 教育 ”以 计算 为 特色 
的 大 数据 教育 则 更 偏向 于 培养 大 数据 算法 与 通用 建 模 
的 人 才 , 培 养 学 生 开发 新 的 大 数据 相关 算法 .模型 或 方 
法 的 能 力 , 要 求学 生 精 通 数据 分 析 理 论 与 方法 ,能 够 解 
决 各 类 较 大 规模 或 结构 复杂 数据 的 处 理 问题 。 这 类 专 
业 的 课程 体系 中 往往 包含 大 量 的 数学 与 统计 学 课程 ， 
在 计算 与 建 模 方面 的 学 习 程 度 更 深 ,通常 设立 在 数学 


方法 层 ”数据 科学 


表 3 北京 邮电 大 学 计算 机 学 院 数据 科学 
与 大 数据 技术 专业 课程 体系 


课程 分 类 课程 名 称 
数学 与 自然 。 数学 分 析 ,高 等 数学 ,大 学 物理 ,物理 实验 .线性 代数 、 概 
科学 基础 率 论 与 随机 过 程 组合 数学 .运筹 学 ,数学 建 模 与 模拟 、 


和 矩阵 理论 与 方法 .离散 数学 .网络 科学 

计算 机 和 数据 科 ”计算 导论 与 程序 设计 、 电 路 与 电子 学 基础 .数字 迎 辑 与 
学 与 大 数据 技术 “数字 系统 ,形式 语言 与 自动 机 数据 结构 算法 设计 与 分 
析 .操作 系统 、 编 译 原理 与 技术 .计算 机 组 成 原理 .计算 
机 系统 结构 计算 机 网 络 数据库 系统 原理 ,大 数据 技术 
基础 .NoSQL 数据 库 技术 数据 可 视 化 数据 仓库 与 数据 
挖掘 ,机 器 学 习 

数据 科学 导论 .软件 工程 计算 导论 与 程序 设计 、 面 向 对 
象 分 析 与 设计 (Java) .并行 计算 与 CPU 编程 .数据 采集 
与 管理 数据 分 析 与 计算 、 数 据 服务 与 应 用 、 技 术 拓 展 、 
网 络 科学 、 人 文 社 科 类 


综合 应 | 


学 院 或 统计 学 院 , 例 如 爱丁堡 大 学 ( University of Edin- 
burgh ) 的 数据 科学 的 运筹 研究 专业 和 纽约 大 学 (New 
York University ) 的 库 朗 数学 学 院 开 设 的 数据 科学 硕士 
专业 "” ,下 面 以 纽约 大 学 为 例 对 其 具体 课程 设置 进行 


列表 ,如 表 4 所 示 : 
表 4 ”纽约 大 学 数学 学 院 数据 科学 硕士 专业 课程 体系 
课程 性 质 课程 名 称 


必修 课程 ”Introduction to Data Science( 数据 科学 导论 ) 
Probability and Statistics for Data Science( 数据 科学 中 的 概率 统 
计 ) 
Machine Learning( 机 器 学 习 ) 
Big Data( 大 数据 ) 
Capstone Project and Presentation( Capstone 项 目 与 演示 ) 
选修 课程 ”Inference and Representation( 推理 与 表示 ) 


Deep Leaming( 深度 学 习 ) 


Natural Language Processing with Representation Learning( 自然 语 

言 处 理 与 表征 学 习 ) 

Natural Language Understanding and Computational Semantics( 自 

然 语 言 理 解 与 计算 语义 ) 

Optimization based Data Analysis( 基于 优化 的 数据 分 析 ) 

Optimization and Computational Linear Algebra( 最 优化 和 计算 线 

性 代数 ) 

纽约 大 学 是 全 球 首 个 创建 “数据 科学 ”( data sci- 

ence) 硕士 专 业 的 高 校 ,专业 招生 面向 具有 数学 、 计 算 
机 科学 和 应 用 统计 学 背景 的 学 生 , 侧 重 于 开发 数据 科 
学 的 新 方法 。 与 本 科 课 程 设置 相 比 ,面向 硕士 研究 生 
的 课程 安排 较 少 ,除了 基础 的 数据 科学 概论 、 大 数据 和 
机 器 学 习 等 课程 外 ,该 专业 的 课程 设置 有 更 多 的 计算 
与 算法 类 课程 ,如 基于 优化 的 数据 分 析 、 优 化 与 计算 线 
性 代数 .数据 科学 领域 的 概率 论 与 统计 学 等 课程 。 
2.2.3 ”以 专业 领域 为 特色 的 大 数据 教育 ”以 专业 领 
域 为 特色 的 大 数据 教育 通常 培养 的 是 特定 行业 领域 的 
大 数据 专业 人 才 , 往 往 要 求学 生 在 掌握 大 数据 技术 与 
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方法 的 同时 ,着 重 对 特定 领域 相关 的 专业 知识 具有 足 
够 的 了 解 ,例如 金融 .生物 、 医 学 等 专业 领域 。 这 种 类 
型 的 专业 教育 对 学 生 的 大 数据 技术 或 建 模 能 力 要 求 较 
低 ,只 需要 其 能 够 在 特定 领域 使 用 相关 方法 与 技术 即 
可 。 目前 ,这 类 专业 通常 设立 在 特定 领域 相应 的 学 科 
学 院 下 ,例如 伦敦 国王 学 院 ( King”s College London ) 在 
数字 人 文学 院 开 设 的 社会 文化 大 数据 专业 "” ,其 将 大 
数据 链接 到 文化 法律 与 伦理 ,地理 .公共 卫生 和 社会 
生活 , 则 在 从 艺术 和 人 文学 的 角度 来 解决 大 数据 的 理 
论 和 实践 问题 ,具体 课程 设置 如 表 5 所 示 : 
表 5 伦敦 国王 学 院 数 字 人 文学 院 社会 文化 大 数据 专业 
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表 6 ”北京 大 学 数学 科学 学 院 数据 科学 与 
大 数据 专业 课程 体系 
课程 分 类 课程 名 称 
数学 与 统 ” 实 变 函 数 .微分 儿 何 . 偏 微分 方程 .拓扑 学 .微分 流 形 .数论 . 群 
计 学 基础 ”与 表示 .基础 代数 几何 密码 学 数理 统计 .随机 过 程 . 多 元 统计 
分 析 ,测度 论 .统计 计算 .抽样 调查 .时 间 序列 分 析 , 非 参数 统 
计 、 试 验 设计 随机 分 析 ,生存 分 析 ` 贝 叶 斯 理论 与 算法 、 统 计 学 
习 、 生 物 信息 学 ,数值 代数 、 数 值 分 析 最 优化 方法 
计算 机 。 程序 设计 与 技术 .计算 机 科学 基础 .计算 机 图 形 学 ,算法 设计 与 
基础 分析. 软件 工程 .操作 系统 ,数据库 数据 结构 与 算法 .信息 安全 
数据 科学 大 数据 分 析 中 的 算法 人工 智能 数据 整合 与 清理 .自然 语言 外 
理 数据 仓库 与 数据 挖掘 数据库 数据 结构 与 算法 .信息 安全 、 
机 器 学 习 
经 济 金 融 ”金融 数学 引 论 ,寿险 精算 , 泰 献 力量 、 衍 生 证 券 基础 金融 经 济 
学 科 ”学 ,金融 数据 分 析 


必修 课程 “Theorising Big Data( 大 数据 理论 ) 

Big Data in Practice : Co-laboratories , Tools and Methods( 实践 中 
的 大 数据 :联合 实验 室 、 工 具 和 方法 ) 

From Data to Insight: Cultural and Social Analytics ( 从 数据 到 洞 
察 力 : 文 化 和 社会 分 析 ) 

Big Data and the Law: Foundations, Regimes and Principles, 
Challenges( 大 数据 与 法 律 :基础 .制度 与 原则 、 挑 战 ) 

Digital Arts and Culture( 数字 艺术 与 文化 ) 

Editorial models for Digital Texts : Theory & Practice( 数字 文本 编 
辑 模型 :理论 与 实践 ) 

Web Technologies( 网 络 技术 ) 

Digital Publishing( 数字 出 版 ) 

Communication & Consumption of Cultural Heritage (文化 遗产 的 
传播 与 消费 ) 

Material Culture of the Book (书籍 的 物质 文化 ) 

Applied Visualization for Cultural Heritage( 文 化 遗产 应 用 可 视 化 ) 
Open Culture( 开放 文化 ) 

Ontologies of Digital Media( 数字 媒体 的 本 体 论 ) 

Social Media: Protest & Political Campaigning( 社交 媒体 :抗议 和 
政治 活动 ) 
Metadata & Systems for Digital Assets & Media( 用 于 数字 资产 和 
媒体 的 元 数据 和 系统 ) 

Management for Digital Content Industries( 数 字 内 容 产 业 的 管理 ) 
Digital Media, Digital Marketing( 数字 媒体 ,数字 营销 ) 

Curating & Preserving Digital Culture( 组 织 与 保存 数字 文化 ) 
Crowds & Clouds - Digital Ecosystems( 人 群 和 云 -数字 生态 系统 ) 


在 我 国 ,以 专业 领域 为 特色 的 数据 科学 与 大 数据 
技术 专业 大 多 与 管理 和 经 济 金融 领域 结合 ,例如 复旦 
大 学 的 管理 学 院 .北京 大 学 元 培 学 院 和 北京 大 学 数学 
科学 学 院 ”等 ,下 面 以 北京 大 学 数学 科学 学 院 为 例 进 
行 课程 设置 列表 , 见 表 6。 

北京 大 学 是 首 批 设 立 “ 数 据 科 学 与 大 数据 技术 ” 
专业 的 三 所 高 校 之 一 ,目前 由 信息 科学 技术 学 院 \ 元 培 
学 院 和 数学 科学 学 院 分 别 开 设 该 专业 。 其 中 数学 科学 
学 院 的 该 专业 为 互联 网 金融 分 析 方 向 ,课程 体系 中 除 


了 大 量 的 数学 与 统计 学 基础 课程 ,还 涉及 到 经 济 金融 
学 科 的 应 用 课程 ,培养 学 生 将 大 数据 理论 与 方法 技术 
应 用 于 经 济 金融 领域 的 能 力 。 综 上 所 述 , 与 国外 的 数 
据 科 学 相关 专业 环境 相 比 ,国内 的 “数据 科学 与 大 数据 
技术 "等 相关 专业 教育 尚 在 起 步 阶 段 ,存在 诸多 不 足 之 
处 。 国 外 的 相关 专业 发 展 已 久 ,而 国内 的 本 科教 育 刚 
正式 进行 了 三 年 左右 ,硕士 教育 也 多 处 于 探索 阶段 , 整 
个 学 科教 育 环 境 尚 不 成 熟 。 在 国外 ,该 学 科 领 域 呈现 
出 多 样 化 的 特点 ,广泛 涉及 除 计算 机 外 的 多 个 学 科 领 
域 ,而 国内 的 该 专业 多 设立 在 计算 机 技术 或 经 济 与 管 
理 相关 的 学 院 , 男 有 少数 设立 在 数学 、 医 疗 等 相关 学 
院 , 其 他 领域 鲜 有 涉猎 ,发 展 方向 尚未 实现 多 样 化 。 此 
外 ,虽然 国内 大 多 数 院 校 的 该 专业 课程 体系 层次 化 较 
为 明显 ,但 在 应 用 层面 上 ,多 是 简单 保留 原 有 专业 的 特 
色 课 程 ,将 大 数据 与 本 专业 紧密 结合 的 课程 设置 仍然 
较 少 ,课程 设置 的 创新 性 不 足 。 

虽然 国内 的 “数据 科学 与 大 数据 技术 "专业 开始 
较 晚 .覆盖 的 专业 领域 多 样 化 不 足 , 且 课程 设置 的 专业 
化 不 足 , 但 在 国内 学 科 设 立 的 初期 ,批准 设立 该 专业 的 


本 科 院 校 覆 盖 面 较 广 ,其 中 985 及 211 高 校 仅 占 约 
13% ,有 利于 大 数据 相关 人 才 的 全 面 培 养 。 


3 ”基于 情报 学 的 数据 科学 与 大 数据 专业 


教育 
3.1 学 科 建 设 意义 

情报 学 (Information Science) 是 指 以 现代 信息 技术 
和 软 科 学 的 研究 方法 作为 主要 手段 ,以 信息 的 采集 、 选 
择 .评价 分析 和 综合 等 系列 化 的 加 工 为 基本 过 程 , 形 
成 新 的 或 增值 的 情报 产品 ,来 满足 用 户 不 同 的 特定 需 
求 ,为 不 同 层次 科学 决策 服务 的 人 文 社 科 类 学 科 '™。 
近年 来 , 随 着 大 数据 技术 的 发 展 ,图 书 情报 领域 的 人 才 
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市 场 需求 也 逐渐 提出 要 掌握 数据 科学 和 大 数据 技术 相 
关 技 能 ,以 2018 年 高 校 应 届 毕 业 生 秋季 招聘 为 例 ,从 
应 届 生 论坛 展示 的 部 分 数据 来 看 ,全 国 逾 百 个 与 情报 
学 相关 的 岗位 招聘 中 明确 提 到 希望 应 聘 者 掌握 大 数据 
相关 技能 或 有 相关 经 历 , 如 广东 数 晶 科 技 有 限 公司 在 
招聘 情报 信息 分 析 人 员 的 信息 中 要 求 有 数据 分 析 能 
力 ,熟练 使 用 SAS 等 数据 统计 软件 5 ;长 沙市 图 书馆 
在 招聘 运 维 专员 时 也 强调 应 聘 者 要 有 较 强 的 大 数据 分 
析 能 力 及 良好 的 定性 分 析 能 力 0 。 

设立 基于 情报 学 的 大 数据 专业 教育 ,属于 上 述 提 
到 的 第 三 种 以 专业 领域 为 特色 的 大 数据 教育 模式 ,这 
种 类 型 的 专业 教育 重点 要 解决 以 下 两 个 问题 :首先 是 相 
关 的 专业 是 否 需 要 大 数据 教育 ,或 者 说 现 有 的 专业 是 否 
硕 在 着 与 大 数据 必然 的 联系 ,是 否 存在 着 相关 联 的 基 
础 区 二 个 问题 是 基于 所 建立 的 大 数据 教育 与 已 有 的 专 
业者 育 之 间 的 关系 , 即 两 者 是 否 存在 差别 。 以 下 结合 情 
报 包 本 身 的 特点 ,试图 对 以 上 两 个 问题 做 出 回答 。 
看 ! 情报 学 与 大 数据 的 关联 性 ”大 数据 分 析 ( Big 
Drta_Analytics, BDA) 是 大 数据 理念 与 方法 的 核心 ,是 
指 对 海量 = 类 型 多 样 .增长 快速 且 内 容 真实 的 数据 ( 即 
万 妆 据 ) 进行 分 析 , 从 中 找 出 可 以 帮助 决策 的 隐藏 模 
式 > 未 知 的 相关 关系 以 及 其 他 有 用 信息 的 过 程 " 。 与 
前 议 中 对 情报 学 的 定义 相 比 ,两 者 都 是 以 信息 和 数据 
作 区 基础 资源 和 研究 对 象 。 数 据 最 早 来 源 于 测量 ,所 
调包 根据 的 数字 ” ,是 对 客观 世界 测量 结果 的 记录 ， 
不 吝 随 意 产生 的 。 而 现 如 今 , 数 据 的 内 容 开 始 扩大 , 它 
不 公 指 有 根据 的 数字 ,还 统称 一 切 保存 在 电脑 中 的 信 
总 6 而 这 些 都 不 再 是 测量 得 到 的 数据 ,而 是 对 客观 世界 
的 一 种 记录 1。 大 数据 不 仅 包括 结构 化 的 数据 ,也 包 
括 非 结构 化 的 数据 ,如 传统 情报 学 所 研究 的 文献 .文本 
以 及 行为 等 数据 都 可 以 成 为 一 种 大 数据 ,情报 学 与 大 
数据 技术 都 要 对 数据 进行 采集 和 加 工 处 理 ,进而 使 用 
数据 带 来 的 价值 。 例 如 ,Min，Song 等 通过 对 大 数据 量 


知识 和 经 验 ,大 数据 价值 的 发 挥 ,是 通过 领域 学 科 来 扩 
散 和 发 挥 的 ,图 书 情报 机 构 也 是 大 数据 行业 中 的 一 员 ， 
与 大 数据 息息相关 。 例 如 ,医院 或 医疗 研究 机 构 通 过 将 
大 数据 技术 应 用 到 医疗 领域 ,使 用 医疗 大 数据 来 帮助 提 
升 医疗 服务 ;商业 咨询 公司 .银行 等 机 构 通 过 分 析 商 业 
大 数据 来 帮助 进行 评级 和 决策 ;交通 和 公共 管理 部 门 通 
过 处 理 城市 交通 大 数据 来 帮助 车 辆 调度 ,减轻 交通 压 
力 。 图 书馆 .中国 知 网 SCI 等 图 书 情 报 机 构 也 通过 文献 
大 数据 分 析 为 大 众 提供 图 书 和 文献 信息 服务 。 

情报 学 最 早出 现 于 第 二 次 世界 大 战 之 后 ,经 过 长 期 
的 发 展 积累 ,已 形成 了 一 套 独 具 特 色 的 研究 方法 与 理论 
体系 。 而 大 数据 的 概念 产生 于 20 世纪 末期 ,在 其 发 展 
过 程 中 ,也 融合 了 多 种 学 科 的 理论 与 方法 ,其 中 就 包括 
情报 学 。 情 报 学 领域 的 诸多 方法 可 以 丰富 大 数据 方法 
-体系 ,帮助 提升 大 数据 技术 效率 。 例 如 情报 学 中 的 引 
文 分 析 方 法 可 帮助 筛选 重点 信息 源 ,从 而 提升 文本 分 析 
和 挖掘 的 效率 ,成 为 大 数据 挖掘 的 前 期 辅助 处 理 。 
3.1.2 情报 学 取向 的 数据 科学 与 大 数据 专业 的 不 可 
替代 性 ”情报 学 与 其 他 领域 的 大 数据 分 析 既 有 联系 又 
有 区 别 ,两 者 的 研究 对 象 虽然 都 是 数据 ,但 情报 学 相关 
的 大 数据 主要 研究 文献 大 数据 ,文本 大 数据 和 行为 大 
数据 。 情 报 学 更 加 注重 资源 的 收集 与 整理 服务 ,在 进 
行 数据 分 析 时 有 明确 的 任务 导向 和 既定 的 模式 ,而 其 
他 学 科 导 向 的 大 数据 分 析 更 加 注重 对 数据 本 身 的 分 
析 , 旨 在 挖 气 新 的 模式 。 

情报 学 也 积累 了 一 套 处 理 这 类 数据 的 理论 和 方法 ， 
包括 分 类 与 主题 的 思想 和 方法 .规范 档 、 元 数据 文献 计 
量 . 引 文 分 析 、 情 报 分 析 的 理论 和 方法 等 。 情 报 学 与 大 
数据 理念 方法 相 结合 ,将 丰富 情报 学 的 内 容 , 提 高 情报 
工作 的 精度 和 效率 ,例如 ,以 往 多 是 通过 以 元 数据 为 代 
表 的 文献 外 部 特征 进行 分 析 , 例 如 关键 词 . 摘 要、 主题 词 
等 ,而 依托 于 数据 科学 与 大 数据 技术 ,能 够 实现 对 文献 
内 部 更 细 粒 度 的 研究 ,例如 词 向 量 分 析 文本 挖掘 等 ,从 


级 的 生物 医学 领域 文献 数据 进行 引文 分 析 , 得 出 了 药 
物 与 疾病 之 间 的 隐 含 联系 ,为 生物 医学 研究 的 临床 实 
验 做 出 贡献 。 冯 元 为 ”提出 通过 构建 人 物 关 联 关 
系 的 知识 图 谱 ,帮助 查询 人 物 的 生活 轨迹 、 社 会 关系 等 
基本 信息 ,从 而 为 公安 情报 工作 带 来 便利 。 

所 谓 “ 大 数据 "都 是 由 具体 的 数据 构成 的 ,不 存在 
抽象 的 “大 数据 ”。 不 管 是 计算 机 领域 研究 的 “大 数 
据 " 还 是 统计 学 ,数学 领域 研究 的 “大 数据 ” ,都 是 与 其 
研究 领域 相 结合 ,解决 对 应 领域 的 特定 问题 ,而 不 是 单 
纯 的 “大 数据 "问题 。 大 数据 价值 的 挖掘 依赖 于 领域 


而 开启 了 文献 领域 研究 的 新 视野 ,丰富 了 研究 的 内 容 。 

此 外 , 随 着 情报 学 学 科 和 社会 的 发 展 ,情报 分 析 呈 
现 出 新 的 特点 ,逐渐 着 重 计算 化 、 多 源 数据 融合 ”分 
析 和 深入 的 内 容 分 析 , 需 要 基于 大 量 数据 构建 大 规模 
的 知识 图 谱 、 社 会 网 络 等 ,而 这 些 都 是 传统 的 情报 学 所 
不 能 完成 的 ,需要 有 新 的 理念 和 方法 加 以 支撑 ,这 就 需 
要 情报 学 与 大 数据 技术 相 结合 , 既 能 加 深情 报 学 的 研 
究 深度 .提升 研究 效率 ,又 能 促进 大 数据 方法 和 技术 的 
发 展 ,实现 两 学 科 的 共同 进步 。 

因此 ,情报 学 取向 的 数据 科学 与 大 数据 专业 与 其 
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他 学 科 取 向 的 该 专业 之 间 不 能 相互 取代 ,都 有 其 不 同 
学 科 特 定 的 研究 内 容 与 侧重 ,都 在 做 其 他 学 科 领 域 无 
法 完成 的 研究 。 男 外 ,情报 学 取向 的 大 数据 教育 也 不 
等 同 于 情报 学 教育 的 扩展 和 扩充 ,不 能 被 情报 学 教育 
取代 。 人 情报 学 取向 的 数据 科学 与 大 数据 专业 的 设置 旨 
在 填补 当前 学 科 专 业 教育 的 空白 , 既 能 丰富 大 数据 与 
数据 科学 专业 的 学 科 应 用 ,又 能 顺应 时 代 特 色 ,促进 图 
书 情报 学 科 的 大 数据 与 数据 科学 专业 人 才 的 培养 。 
3.2 培养 目标 

情报 学 取向 的 “数据 科学 与 大 数据 技术 专业 ”中 
在 培养 具有 大 数据 思维 和 扎实 的 情报 学 专业 基础 、 掌 


课程 ;最 顶层 是 应 用 层 , 代 表 需 要 利用 数据 科学 去 解决 
情报 学 问题 的 应 用 场景 ,课程 包括 情报 学 基础 课程 和 
情报 学 与 大 数据 融合 的 前 沿 特色 课程 。 
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面 对 大 数据 时 代 大 量 的 数据 科学 类 多 层次 的 人 才 
需求 ,数据 科学 与 大 数据 技术 专业 不 仅 需 要 计算 机 、 数 
学 和 统计 学 学 科 背 景 ,同样 需要 情报 学 等 以 数据 为 基 
础 的 人 文 社 科 领 域 共同 促进 发 展 。 人 情报 学 与 大 数据 既 
有 联系 又 有 不 同 ,情报 学 与 大 数据 技术 的 研究 对 象 都 
包括 数据 , 而 大 数据 价值 的 发 挥 要 依靠 各 个 学 科 的 交 


握 大 数据 处 理 技术 及 分 析 理 论 .熟悉 大 数据 技术 与 方 
法 ,能 够 运用 统计 向 量 分 析 、 机 器 学 习 \ 文 本 挖 气 等 技 
杭 s 从 大 量 数 据 中 提取 对 情报 学 研究 与 实践 有 意义 的 
停 贸 ,并 以 社会 网 络 和 知识 图 谱 等 技术 展现 的 高 层次 
复命 型 人 才 。 系 统 地 培养 学 生 掌握 大 数据 应 用 中 解决 
情 氢 学 中 各 种 典型 问题 的 解决 办 法 ,实际 提升 学 生 解 
决 英 际 问题 的 能 力 , 增 养 学 生 将 情报 学 领域 知识 与 计 
算 柜 技术 和 大 数据 技术 融合 、 创 新 的 能 力 。 对 符合 
呈 关 和 此 LE 业 要 求 的 学 生 授 了 予 管理 学 学 士 学 位 。 

$A > 课程 设置 

CD 站 合 以 上 四 个 模 顽 ,基于 “基础 层 方法 层 -应 用 
情 的 层次 体系 ,对 情报 学 取向 的 数据 科学 与 大 数据 技 
术 过 业 课程 体系 设置 如 图 2 所 示 : 


DD 
《加 基础 课程 ee 方法 课程 和 应 用 课程 ) 
NN Bl ~N 
基 统计 与 数据 分 析 @ 数据 挖掘 @ ”情报 学 概论 
CY ee @ ”数据 仓库 @ ”信息 资源 建设 与 
仿 高 等 数学 @ ”机 器 学 习 管理 
®@ ”高 等 代数 ”深入 学 习 @ “信息 检索 
e@ 概率 论 e@ 人工 智 能 @ ”知识 组 织 
离散 数学 @ 神经 网 络 @ 情报 信息 服务 / 
@ ”数据 可 视 化 
@ ”大 数据 管理 与 存 fk \ 
储 
@ ”程序 设计 语言 @ ”分 布 式 系统 @ 文献 大 数据 分 析 
@ ”数据 结构 ee @ ”交互 式 信息 检索 
数据 分 析 与 统计 
@ 数据库 建 模 . 户 大 数据 研究 
@ 计算 机 原理 社会 网 络 分 析 @ 文本 挖 所 与 自然 
@ 计算 机 网 络 语言 处 理 


图 2 情报 学 取向 的 “数据 科学 与 大 数据 
技术 专业 ”课程 体系 


其 中 ,底层 是 基础 层 课 程 ,代表 统计 学 、 数 学 与 计 
算 机 应 用 技术 等 基础 课程 ;中 间 层 则 是 方法 层 , 代 表 数 
据 科学 方法 相关 课程 ,对 大 数据 进行 理解 .抽象 、 建 模 ， 
然后 在 底层 的 计算 平台 上 予以 实现 的 相关 理论 和 技术 
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又 融合 ,同时 图 书 情报 机 构 也 是 大 数据 行业 中 的 一 员 。 

情报 学 为 大 数据 提供 了 基础 研究 方法 ,促进 了 多 源 数 

据 融合 ,拓宽 了 大 数据 的 应 用 领域 ;大 数据 为 情报 学 研 

究 提供 了 更 多 的 可 能 性 .丰富 了 研究 方法 ,提升 了 研究 

效率 ,扩大 了 研究 范围 。 情 报 学 取向 的 大 数据 与 数据 

科学 专业 人 才 的 培养 , 既 有 其 必要 性 ,又 有 其 不 可 替代 

性 ,将 填补 该 专业 教育 在 中 国 的 空白 。 情 报 学 取向 的 

大 数据 与 数据 科学 专业 既 不 是 传统 情报 学 的 简单 扩 

充 ,也 不 能 被 其 他 学 科 取 向 的 大 数据 与 数据 科学 专业 

所 取代 。 
国内 的 大 数据 相关 专业 教育 尚 处 于 初步 探索 阶 

段 ,发 展 时 间 较 短 , 依 然 有 很 多 不 足 之 处 ,覆盖 的 学 科 

领域 需要 应 市 场 与 社会 发 展 的 需求 而 不 断 丰 富 ,情报 

学 等 图 书 情报 领域 学 科 的 加 入 也 可 以 促进 大 数据 技术 

的 发 展 .学科 体系 的 丰富 和 不 同学 科 的 交叉 融合 ,帮助 

培养 更 多 的 跨 学 科 应 用 与 科研 人 才 。 此 外 ,学 科 体系 

也 需 进 一 步 改革 创 新 ,促进 各 院 校 设立 更 多 紧密 结合 

大 数据 与 原 专 业 的 新 兴 课 程 ,进而 丰富 课程 体系 、 提 升 

教学 质量 与 效果 。 
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CBPalent Training of Information Science Oriented “ Data Science and Big Data Technology” Discipline 
Chen Mo Li Guangjian Chen Congcong 
s = Department of Information Management, Peking University, Beijing 100871 


SAbstract: [Purpose/significance | As a highly computational humanities and social sciences discipline ，information 


sciEmoe has the characteristics of data science. Big data related technology can provide an effective means for information 
science. Therefore, establishing the information science oriented “ Data Science and Big Data Technology” discipline that 
ailhs)at training inter -disciplinary talents can promote the development of information science, and these talents have big 
data thinking and solid information science professional basis, mastering big data processing technology and analytical the- 
ory applied to the theory and practice of information science. [ Method/process| We investigated the training objectives 
and curriculum model of big data related majors at home and abroad, summarized the development characteristics of sub- 
ject education, and combined the teaching resources of domestic to design a training plan for big data professionals with in- 
formation science orientation. [ Result/conclusion | There are both connections and differences between information sci- 
ence and big data. Information science provides basic research methods for big data, promotes the fusion of multiple 
source data, and broadens the application fields of big data. Big data provides more possibilities for information science re- 
search, enriches research methods, improves research efficiency, and expands the scope of research. There are both ne- 
cessity and irreplaceability of the talent training of information science oriented “ data science and big data technology” 
discipline. It will fill the gap in this professional education in China. Tt is necessary to further reform and innovate the dis- 
ciplinary system, and to establish more emerging courses that closely integrate big data and information science, such as 
literature big data analysis and user big data research, so as to systematically cultivate students ”ability to integrate knowl- 
edge in the field of information science with computer technology and big data technology. 


Keywords: information science education talent training big data data science 
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